# 导入所需库
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs

# 生成模拟数据
# 这里我们创建一个包含3个类别的数据集，每个类别有不同数量的点和方差
X, _ = make_blobs(n_samples=300, centers=3, cluster_std=[1.0, 1.5, 0.5], random_state=42)

# 使用KMeans++算法进行聚类
kmeans_plus = KMeans(n_clusters=3, init='k-means++', random_state=42) # 'k-means++' 是关键参数
kmeans_plus.fit(X)

# 可视化结果
plt.figure(figsize=(10, 5))

# 绘制原始数据点
plt.subplot(1, 2, 1)
plt.scatter(X[:, 0], X[:, 1], c='grey')
plt.title('Original Data')

# 绘制K-means++聚类结果
plt.subplot(1, 2, 2)
plt.scatter(X[:, 0], X[:, 1], c=kmeans_plus.labels_, cmap='viridis')
plt.scatter(kmeans_plus.cluster_centers_[:, 0], kmeans_plus.cluster_centers_[:, 1], s=300, c='red', label='Centroids')
plt.title('K-means++ Clustering Result')
plt.legend()

plt.show()
